智能论文笔记

Uncertainty in Contrastive Learning: On the Predictability of Downstream Performance

Shervin Ardeshir , Navid Azizan

分类：机器学习 | 人工智能 | 计算机视觉 | (统计)机器学习

2022-07-19

当今一些最先进的深度学习模型的出色表现在某种程度上是由于在大型数据集上进行了广泛的（自我）监督的对比预处理。相比之下，该网络是通过成对的正（相似）和负（不同的）数据点呈现的，并经过培训以找到每个数据点的嵌入向量，即一个表示形式，可以进一步调整各种下游任务。为了将这些模型安全地部署在关键的决策系统中，至关重要的是要使他们衡量其不确定性或可靠性。然而，由于训练对比模型的成对性质，并且在输出（抽象嵌入矢量）上缺乏绝对标签，因此将常规不确定性估计技术适应此类模型是不平凡的。在这项工作中，我们研究是否可以以有意义的方式量化此类表示形式的不确定性。换句话说，我们探索给定数据点上的下游性能是否可以直接从其预训练的嵌入中预测。我们表明，可以通过直接估算嵌入空间中训练数据的分布并考虑表示表示的局部一致性来实现此目标。我们的实验表明，嵌入向量的不确定性概念通常与其下游精度密切相关。

translated by 谷歌翻译

A Deep Learning Architecture for Passive Microwave Precipitation Retrievals using CloudSat and GPM Data

Reyhaneh Rahimi , Sajad Vahedizadeh , Ardeshir Ebtehaj

分类：机器学习

2022-12-02

This paper presents an algorithm that relies on a series of dense and deep neural networks for passive microwave retrieval of precipitation. The neural networks learn from coincidences of brightness temperatures from the Global Precipitation Measurement (GPM) Microwave Imager (GMI) with the active precipitating retrievals from the Dual-frequency Precipitation Radar (DPR) onboard GPM as well as those from the {CloudSat} Profiling Radar (CPR). The algorithm first detects the precipitation occurrence and phase and then estimates its rate, while conditioning the results to some key ancillary information including parameters related to cloud microphysical properties. The results indicate that we can reconstruct the DPR rainfall and CPR snowfall with a detection probability of more than 0.95 while the probability of a false alarm remains below 0.08 and 0.03, respectively. Conditioned to the occurrence of precipitation, the unbiased root mean squared error in estimation of rainfall (snowfall) rate using DPR (CPR) data is less than 0.8 (0.1) mm/hr over oceans and land. Beyond methodological developments, comparing the results with ERA5 reanalysis and official GPM products demonstrates that the uncertainty in global satellite snowfall retrievals continues to be large while there is a good agreement among rainfall products. Moreover, the results indicate that CPR active snowfall data can improve passive microwave estimates of global snowfall while the current CPR rainfall retrievals should only be used for detection and not estimation of rates.

translated by 谷歌翻译

MultiCoNER: A Large-scale Multilingual dataset for Complex Named Entity Recognition

Shervin Malmasi , Anjie Fang , Besnik Fetahu , Sudipta Kar , Oleg Rokhlenko

分类：自然语言处理

2022-08-30

我们提出了多语言数据集的Multiconer，用于命名实体识别，涵盖11种语言的3个域（Wiki句子，问题和搜索查询），以及多语言和代码混合子集。该数据集旨在代表NER中的当代挑战，包括低文字方案（简短和未添加的文本），句法复杂的实体（例如电影标题）和长尾实体分布。使用基于启发式的句子采样，模板提取和插槽以及机器翻译等技术，从公共资源中汇编了26M令牌数据集。我们在数据集上应用了两个NER模型：一个基线XLM-Roberta模型和一个最先进的Gemnet模型，该模型利用了Gazetteers。基线实现了中等的性能（Macro-F1 = 54％），突出了我们数据的难度。 Gemnet使用Gazetteers，显着改善（Macro-F1 =+30％的平均改善）。甚至对于大型预训练的语言模型，多功能人也会构成挑战，我们认为它可以帮助进一步研究建立强大的NER系统。 Multiconer可在https://registry.opendata.aws/multiconer/上公开获取，我们希望该资源将有助于推进NER各个方面的研究。

translated by 谷歌翻译

Development of a CAV-based Intersection Control System and Corridor Level Impact Assessment

Ardeshir Mirbakhsh , Joyoung Lee , Dejan Besenski

分类：人工智能

2022-08-21

本文通过像素保留算法和深度增强学习（DRL）决策逻辑的结合，为CAV提供了无信号的交叉控制系统，然后是对拟议模型的走廊级影响评估。像素保留算法检测到潜在的碰撞操作，DRL逻辑优化了车辆的运动，以避免碰撞并最大程度地减少交叉路口的整体延迟。拟议的控制系统称为分散的稀疏协调系统（DSCLS），因为每辆车都有自己的控制逻辑，并且仅在协调状态下与其他车辆互动。由于在DRL的培训课程中采取随机行动的链条影响，训练有素的模型可以应对前所未有的体积条件，这在交叉管理中构成了主要挑战。将开发模型的性能与传统和基于CAV的控制系统进行了比较，包括固定的交通信号灯，驱动的交通信号灯以及最长的队列第一（LQF）控制系统，在Vissim软件中四个交叉路口的走廊中，在三个卷机制下进行了比较。模拟结果表明，与其他基于CAV的控制系统相比，提出的模型在中等，高和极端体积方案中将延迟减少了50％，29％和23％。旅行时间，燃油消耗，排放和替代安全措施（SSM）的改善也很明显。

translated by 谷歌翻译

Synthesizing Rolling Bearing Fault Samples in New Conditions: A framework based on a modified CGAN

Maryam Ahang , Masoud Jalayer , Ardeshir Shojaeinasab , Oluwaseyi Ogunfowora , Todd Charter , Homayoun Najjaran

分类：机器学习

2022-06-24

轴承是容易出乎意料断层的旋转机的重要组成部分之一。因此，轴承诊断和状况监测对于降低众多行业的运营成本和停机时间至关重要。在各种生产条件下，轴承可以在一系列载荷和速度下进行操作，这会导致与每种故障类型相关的不同振动模式。正常数据很足够，因为系统通常在所需条件下工作。另一方面，故障数据很少见，在许多情况下，没有记录故障类别的数据。访问故障数据对于开发数据驱动的故障诊断工具至关重要，该工具可以提高操作的性能和安全性。为此，引入了基于条件生成对抗网络（CGAN）的新型算法。该算法对任何实际故障条件的正常和故障数据进行培训，从目标条件的正常数据中生成故障数据。所提出的方法在现实世界中的数据集上进行了验证，并为不同条件生成故障数据。实施了几种最先进的分类器和可视化模型，以评估合成数据的质量。结果证明了所提出的算法的功效。

translated by 谷歌翻译

Intrinsic dimensionality and generalization properties of the $\mathcal{R}$-norm inductive bias

Clayton Sanford , Navid Ardeshir , Daniel Hsu

分类：机器学习

2022-06-10

我们研究了$ \ Mathcal {r} $的结构和统计属性 - 规范最小化由特定目标函数标记的数据集的内侧插值。$ \ MATHCAL {R} $ - 标准是两层神经网络的电感偏差的基础，最近引入了捕获网络权重大小的功能效果，与网络宽度无关。我们发现，即使有适合数据的脊函数，这些插值也是本质上的多元功能，而且$ \ Mathcal {r} $ - 规范归纳偏见不足以实现某些学习问题的统计上最佳概括。总的来说，这些结果为与实际神经网络训练有关的感应偏见提供了新的启示。

translated by 谷歌翻译

BFS-Net: Weakly Supervised Cell Instance Segmentation from Bright-Field Microscopy Z-Stacks

Shervin Dehghani , Benjamin Busam , Nassir Navab , Ali Nasseri

分类：计算机视觉 | 人工智能

2022-06-09

尽管有广泛的可用性，但由于采集过程的投射性质，从明亮场显微镜（BFM）中获取的体积信息固有地很困难。我们从一组BFM Z-stack图像中研究了3D细胞实例的预测。我们提出了一种新型的两阶段弱监督方法，用于细胞的体积实例分割，这仅需要近似细胞质心注释。因此，创建的伪标签是通过Z-stack Guidance进行了新颖的改进损失来完善的。评估表明，我们的方法不仅可以推广到BFM Z-stack数据，还可以将其他3D单元成像模式推广到。我们的管道与完全监督的方法的比较表明，减少数据收集和标记的显着增益会导致较小的性能差异。

translated by 谷歌翻译

ColibriDoc: An Eye-in-Hand Autonomous Trocar Docking System

Shervin Dehghani , Michael Sommersperger , Junjie Yang , Benjamin Busam , Kai Huang , Peter Gehlbach , Iulian Iordachita , Nassir Navab , M. Ali Nasseri

分类：机器人 | 计算机视觉

2021-11-30

视网膜手术是一种复杂的医疗程序，需要特殊的专业知识和灵巧。为此目的，目前正在开发几种机器人平台，以实现或改善显微外科任务的结果。由于这种机器人的控制通常被设计用于在视网膜附近导航，成功的套管针对接并将仪器插入眼睛中代表了一种额外的认知努力，因此是机器人视网膜手术中的开放挑战之一。为此目的，我们为自主套管针对接的平台结合了计算机愿景和机器人设置。灵感来自古巴Colibri（蜂鸟）使用只使用视觉将其喙对齐，我们将相机安装到机器人系统的内逸线器上。通过估计套管针的位置和姿势，机器人能够自主地对齐并导航仪器朝向贸易圈的入口点（TEP），最后执行插入。我们的实验表明，该方法能够精确地估计套管针的位置和姿势，实现可重复的自主对接。这项工作的目的是降低机器人设置准备在手术任务之前的复杂性，因此增加了系统集成到临床工作流程的直观。

translated by 谷歌翻译

Efficient Action Recognition Using Confidence Distillation

Shervin Manzuri Shalmani , Fei Chiang , Rong Zheng

分类：计算机视觉 | 人工智能

2021-09-05

现代神经网络是强大的预测模型。但是，当认识到他们的预测可能是错误的时，他们的表现不佳。例如，对于最常见的激活函数之一，relu及其变体，即使是经过良好校准的模型也会产生不正确但置信度高的预测。在相关的动作识别任务中，大多数当前的分类方法基于剪辑级分类器，这些分类器密集地对给定的视频进行了非重叠，相同尺寸的剪辑并使用聚合函数（通常为平均值）来汇总结果，以达到视频级别预测。尽管这种方法已证明是有效的，但它在识别精度上是最佳的，并且具有较高的计算开销。为了减轻这两个问题，我们提出了信心蒸馏框架，以教导老师对学生抽样的不确定性表示，并将学生和教师模型之间的完整视频预测任务分开。我们对三个动作识别数据集进行了广泛的实验，并证明我们的框架在动作识别精度（最高20％）和计算效率（超过40％）方面取得了重大提高。

translated by 谷歌翻译

Image Segmentation Using Deep Learning: A Survey

Shervin Minaee , Yuri Boykov , Fatih Porikli , Antonio Plaza , Nasser Kehtarnavaz , Demetri Terzopoulos

分类：

2020-01-15

Image segmentation is a key topic in image processing and computer vision with applications such as scene understanding, medical image analysis, robotic perception, video surveillance, augmented reality, and image compression, among many others. Various algorithms for image segmentation have been developed in the literature. Recently, due to the success of deep learning models in a wide range of vision applications, there has been a substantial amount of works aimed at developing image segmentation approaches using deep learning models. In this survey, we provide a comprehensive review of the literature at the time of this writing, covering a broad spectrum of pioneering works for semantic and instance-level segmentation, including fully convolutional pixel-labeling networks, encoder-decoder architectures, multi-scale and pyramid based approaches, recurrent networks, visual attention models, and generative models in adversarial settings. We investigate the similarity, strengths and challenges of these deep learning models, examine the most widely used datasets, report performances, and discuss promising future research directions in this area.

translated by 谷歌翻译